万字详解YOLOv8网络结构Backbone/neck/head以及Conv、Bottleneck、C2f、SPPF、Detect等模块

您所在的位置:网站首页 骨干 意思 万字详解YOLOv8网络结构Backbone/neck/head以及Conv、Bottleneck、C2f、SPPF、Detect等模块

万字详解YOLOv8网络结构Backbone/neck/head以及Conv、Bottleneck、C2f、SPPF、Detect等模块

2024-07-10 06:03| 来源: 网络整理| 查看: 265

输入图像:输入图像的尺寸为 ( 640 × 640 × 3 ) (640 \times 640 \times 3) (640×640×3),其中640表示高度和宽度,3表示颜色通道(RGB)。

卷积块参数:

卷积核大小:3步长:2填充:1

步长和填充的影响:

步长:步长为2意味着卷积核每次移动2个像素。这将输入图像的空间尺寸减半。填充:填充为1意味着在输入图像的每一边都增加一圈零,这有助于在卷积后保持空间维度。

输出计算:

计算卷积操作输出尺寸 ( ( W o u t × H o u t ) ) ( (W_{out} \times H_{out}) ) ((Wout​×Hout​))的公式为: W o u t = ( W i n − 卷积核大小 + 2 × 填充 ) 步长 + 1 W_{out} = \frac{(W_{in} - \text{卷积核大小} + 2 \times \text{填充})}{\text{步长}} + 1 Wout​=步长(Win​−卷积核大小+2×填充)​+1 H o u t = ( H i n − 卷积核大小 + 2 × 填充 ) 步长 + 1 H_{out} = \frac{(H_{in} - \text{卷积核大小} + 2 \times \text{填充})}{\text{步长}} + 1 Hout​=步长(Hin​−卷积核大小+2×填充)​+1

代入公式计算: W o u t = ( 640 − 3 + 2 × 1 ) 2 + 1 = 640 − 3 + 2 2 + 1 = 639 2 + 1 = 320 W_{out} = \frac{(640 - 3 + 2 \times 1)}{2} + 1 = \frac{640 - 3 + 2}{2} + 1 = \frac{639}{2} + 1 = 320 Wout​=2(640−3+2×1)​+1=2640−3+2​+1=2639​+1=320 H o u t = ( 640 − 3 + 2 × 1 ) 2 + 1 = 640 − 3 + 2 2 + 1 = 639 2 + 1 = 320 H_{out} = \frac{(640 - 3 + 2 \times 1)}{2} + 1 = \frac{640 - 3 + 2}{2} + 1 = \frac{639}{2} + 1 = 320 Hout​=2(640−3+2×1)​+1=2640−3+2​+1=2639​+1=320

因此,输出特征图的尺寸为 ( 320 × 320 ) (320 \times 320) (320×320)。

输出特征图:

卷积块产生的特征图尺寸为 ( 320 × 320 × C ) (320 \times 320 \times C) (320×320×C),其中 ( C ) (C) (C)是卷积层的输出通道数量,由使用的卷积核数量决定。例如,如果卷积层有64个卷积核,输出特征图的尺寸将为 ( 320 × 320 × 64 ) (320 \times 320 \times 64) (320×320×64)。


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3